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摘要 : [目的 /意义 ] 针对 基于 内 容 的 个 性 化 推荐 策 
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武汉 430079 


略 ,提出 资源 特征 选择 与 权 值 计算 优化 策略 ,从 而 改善 


个 性 化 推荐 的 效果 。 [方法 /过程 ] 构建 基于 用 户 决策 机 理 的 个 性 化 推荐 模型 ,模型 以 用 户 决 策 机 理 为 背景 知 
识 进行 资源 特征 的 选择 、 用 户 兴 趣 模 型 的 构建 与 语义 表示 、 用 户 决 策 函 数 构建 。 为 验证 模型 效果 ,以 4748 位 用 
户 的 观 影 数 据 为 例 进行 实验 ,实验 以 向 量 空间 模型 为 参照 模型 ,P@NN 为 评价 指标 。[ 结果 /结论 ] 实验 结果 显 
示 , 在 N 取 值 为 5、10、20、50、100、200 的 情况 下 ,基于 用 户 决策 机 理 的 个 性 化 推荐 模型 效果 都 显著 优 于 向 量 空 


间 模 型 ,从 而 验证 模型 的 有 效 性 。 
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"近年 来 ,作为 一 种 解决 信息 过 载 的 有 效 手段 ,个 性 
化 推荐 受到 了 广泛 关注 "“”。 其 中 ,基于 内 容 的 推荐 
(Epowient-Based Recommendation) 是 一 种 较为 常见 的 实 
现 轧 路 ,其 取得 良好 效果 的 关键 是 合理 的 资源 特征 选 
择 司 权 值 计算 六 。 从 基于 内 容 的 个 性 化 推荐 基本 原理 
出 发 ,理想 的 资源 特征 应 该 既是 用 户 决策 时 的 参考 因 
未 名 能 够 实现 用 户 感 兴趣 资源 与 其 他 资源 的 区 分 ; 理 
想 网 权 值 计算 策略 则 既 需 要 反映 单个 资源 特征 对 用 户 
决 渍 影响 的 大 小 ,又 需要 在 多 特征 融合 时 契合 用 户 决 
策 枫 制 。 但 以 往 的 研究 过 于 关注 所 选 资 源 特征 及 其 权 
值 计算 方 法 能 否 实现 用 户 历史 感 兴趣 资源 与 其 他 资源 
的 区 分 ,而 对 其 是 否 契 合用 户 决策 机 理 关注 不 足 。 一 
方面 可 能 导致 所 选 资源 特征 未 必 是 用 户 决策 时 关注 的 
因素 ; 另 一 方面 也 可 能 导致 所 选 资源 特征 在 权 值 计算 
中 未 得 到 合理 处 理 ,进而 影响 个 性 化 推荐 的 效果 。 为 


的 用 户 决 策 机 理 进行 了 多 方面 研究 ,并 已 将 用 户 决策 
机 理 初步 应 用 到 基于 内 容 的 个 性 化 推荐 中 ,下 面 对 相 
关 成 果 进 行 综述 。 
1.1 电子 商务 与 信息 消费 中 的 用 户 决 策 机 理 

决策 机 理 研究 在 心理 学 、 经 济 学 等 相关 领域 已 经 
有 多 年 历史 ,形成 了 包括 理性 决策 模型 有限 理性 决策 
模型 .前景 理论 ,偏好 构造 理论 等 在 内 的 多 个 决策 理论 
模型 ” 。 近 年 来 , 随 着 互联 网 和 电子 商务 的 发 展 ,国内 
外 学 者 围绕 网 络 购物 和 信息 消费 情境 下 的 用 户 决 策 机 
理 进 行 了 探索 ,并 取得 一 系列 成 果 。 李 宗 伟 等 从 整体 
出 发 对 影响 消费 者 在 线 购买 决策 的 因素 进行 了 研究 ， 
认为 主要 因素 包括 商品 价格 、 商 品 销量 、 卖 家 信用 等 
级 .卖家 服务 评级 、 卖 家 开店 时 间 、 在 线 评论 长 度 "。 
围绕 智能 手机 购买 决策 中 的 影响 因素 ,K. L. Lay-Yee 
等 ”和 本 Sujata 等 ”分 别 进行 了 研究 ,前 者 认为 主要 


解决 这 些 问题 ,可 以 将 用 户 决策 机 理 作 为 个 性 化 推荐 
策略 设计 的 背景 知识 ,以 此 指导 资源 特征 的 选取 、 用 户 
兴趣 模型 的 构建 及 特征 权 值 的 计算 与 融合 。 


1 相关 研究 


近年 来 ,国内 外 学 者 围绕 电子 商务 与 信息 消费 中 


因素 包括 产品 特色 便捷 性 .品牌 .价格 .熟人 影响 等 ， 
后 者 则 在 因素 归 类 上 上 略 有 区 别 , 将 其 归纳 为 技术 、 硬 
件 .基础 因素 .品牌 .价格 5 类 。 在 数字 图 书馆 信息 资 
源 利用 决策 中 。S. Joo 等 认为 用 户 的 有 用 性 和 易 用 人 性 
感知 ,以 及 信息 资源 质量 (可 获得 性 可 信 度 .范围 .新 
颖 性 和 格式 ) 显著 影响 用 户 的 最 终 决 策 ”。 查 先进 等 
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则 将 影响 因素 分 成 直接 影响 因素 和 间接 影响 因素 ,前 
者 包括 信息 有 用 性 、 对 数字 图 书馆 的 依恋 ;后 者 包括 数 
字 图 书馆 的 信息 质量 、 数 字 图 书馆 的 信 源 可 信和 度 、 数 字 
图 书馆 的 声誉 三 个 方面 ,它们 通过 信息 有 用 性 间接 产 

影响 ”。 吴 江 和 周 露 莎 采用 回归 分 析 的 方式 对 影 


据 ""; 杨 程 等 在 进行 面向 开发 者 的 开源 项 目 推 荐 研究 
中 ,首先 分 别 计算 候选 项 目的 流行 度 、 与 用 户 技术 能 

的 相关 度 ,社交 关联 度 , 然 后 对 其 加 权 求 和 ,生成 推荐 
列表 。 
总 体 来 看 ,国内 外 学 者 围绕 不 同情 境 下 的 用 户 决 


响 用 户 购买 网 络 健康 信息 服务 决策 的 因素 进行 了 研 
究 ,并 将 其 归纳 为 医生 职称 医院 等 级 .评论 数量 ,好评 
率 .感谢 信 数 量 . 诊 后 报到 患者 人 数 几 个 方面 5 。 
1.2 ”用 户 决策 机 理 在 基于 内 容 的 推荐 中 的 应 用 

除 少量 研究 之 外 ,如 选择 频率 中 心 、 短 时 平均 能 
量 .过 零 率 .MFCC ,带宽 等 作为 音乐 推荐 的 特征 ， 
其 他 基于 内 容 的 推荐 研究 都 或 多 或 少 地 考虑 了 用 户 决 
策 机 理 。 概 括 起 来 ,可 以 将 其 分 为 特征 选择 中 考虑 用 
户 束 策 机 理 和 权 值 计算 中 考虑 用 户 决策 机 理 两 类 。 
全 (1 ) 特 征 选 择 中 考虑 用 户 决策 机 理 。 这 类 研究 在 
代 量 化 推荐 模型 构建 中 选择 对 用 户 决 策 有 影响 的 因素 
和 E 因 建 模特 征 , 但 在 权 值 计算 环节 却 将 各 类 因素 混在 
泥 , 不 加 区 分 ,较为 典型 的 就 是 向 量 空 间 模 型 。 例 
刀 、 协 向 大 学 生 的 图 书 推荐 中 将 用 户 专 业 \ 年 级 .图 书 
闪现 作者 等 作为 建 模特 征 “” ,电影 推荐 中 将 类 型 . 导 
寅 员 等 作为 建 模 特征 "1, 音 乐 推荐 中 将 语言 . 民 
旗 文 化 位置. 风格 流派 ,歌手 等 因素 作为 建 模特 


] 
征 上 9。 


.三 (2) 权 值 计算 中 考虑 用 户 决策 机 理 。 该 思路 是 指 
奏 和 性 化 推荐 中 ,首先 计算 各 个 特征 的 权 值 ,然后 根据 
用 澡 决 策 中 这 些 特征 的 作用 方式 对 其 融合 ,生成 最 终 
推荐 结果 。 例 如 ,基于 情境 的 个 性 化 推荐 中 ,首先 分 别 
考 葛 用 户 对 资源 本 身 的 兴趣 和 情境 因素 ,在 此 基础 上 
对 二 者 进行 融合 获得 综合 权 值 ”-" ;李江 等 在 学 术 评 
审 的 专家 推荐 研究 中 ,首先 分 别 计算 候选 专家 与 评审 
对 象 的 专长 吻合 度 .学术 影响 力 与 社会 关联 值 ,在 此 基 
础 上 将 3 个 维度 权 值 的 乘积 作为 衡量 推荐 与 否 的 依 


策 机 理 进 行 了 多 方面 研究 ,而 且 用 户 决 策 机 理 融 入 到 
个 性 化 推荐 中 已 经 得 到 了 一 定 程度 的 认可 ,并 证 实 了 
其 有 效 性 。 但 以 用 户 决 策 机 理 为 主题 的 研究 往往 只 注 
意 到 了 其 在 市 场 营 销 方面 的 应 用 价值 , 极 少 提 及 其 在 
个 性 化 推荐 中 的 应 用 意义 。 而 个 性 化 推荐 中 的 用 户 决 
策 机 理应 用 还 处 于 自发 阶段 ,缺乏 系统 性 :中 特征 选择 
往往 基于 研究 者 的 经 验 观察 进行 ,而 非 从 用 户 决策 机 
理 出 发 , 自 上 而 下 的 进行 特征 选择 或 抽取 挖掘, 可 能 
会 导致 所 选 特 征集 合 无 法 全 面 涵盖 用 户 决策 的 影响 因 
素 , 如 文献 [19] 提 出 的 专家 推荐 策略 中 未 考虑 工作 态 
度 等 因素 ” ;@ 在 特征 间 关联 关系 分 析 中 ,已 有 研究 
多 是 从 自身 经 验 或 逻辑 分 析出 发 ,而 非 以 用 户 决 策 机 
理 的 系统 研究 为 基础 ,由 此 就 可 能 导致 因素 间 的 关系 
分 析 有 偏差 ,尤其 是 特征 较 多 时 ,进而 影响 特征 融合 的 
效果 。 针 对 以 上 两 个 问题 ,笔者 首先 构建 一 个 基于 用 
户 决策 机 理 的 个 性 化 推荐 通用 模型 ,立足 于 用 户 决 策 
机 理 进行 特征 选择 ,用 户 兴 趣 模 型 构建 与 决策 函数 拟 
合 策略 设计 ,并 在 此 基础 上 以 电影 推荐 为 例 验证 模型 


效果 。 


2 基于 用 户 决策 机 理 的 个 性 化 推荐 模型 

在 基于 用 户 决策 机 理 的 个 性 化 推荐 中 ,用 户 决策 
机 理 的 定位 是 作为 推荐 策略 设计 的 背景 知识 指导 资源 
特征 的 选择 兴趣 模型 构建 与 语义 表示 \ 决 策 函 数 生 
成 ,使 得 构建 的 推荐 模型 可 以 更 好 地 拟 合 用 户 的 实际 
决策 ,从 而 改进 个 性 化 推荐 的 效果 。 模 型 构成 要 素 及 
其 关联 关系 如 图 1 所 示 : 


图 1 基于 用 户 决策 机 理 的 个 性 化 推荐 模型 


适用 元 余 决策 函数 生成 兴趣 模型 语义 描述 候 基 
一 和 
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2.1 用 户 决策 机 理 分 析 

用 户 决策 机 理 分 析 是 后 续 几 个 模块 运行 的 基础 ， 
也 是 影响 推荐 效果 的 关键 因素 。 其 核心 任务 是 ,针对 
拟 推荐 的 产品 或 服务 ,厘清 影响 用 户 决策 的 主要 因素 、 
作用 机 制 ,决策 过 程 中 各 因素 间 的 关联 关系 等 。 在 分 
析 实 现 上 ,心理 学 领域 已 经 提出 了 多 种 行 之 有 效 的 方 
法 ,包括 元 分 析 法 ` 实 验 法 观察 法 .问卷 法 ,访谈 法 、 回 
归 分 析 法 等 ” ,在 具体 分 析 中 可 以 结合 拟 推荐 产品 或 
服务 的 实际 情况 进行 方法 的 选择 。 

值得 指出 的 是 ,在 分 析 过 程 中 需要 特别 关注 以 下 


于 量化 的 特征 。 
2.3 兴趣 建 模 

该 模块 的 作用 是 立足 于 所 选 资源 特征 及 用 户 决策 
机 理 , 根 据 用 户 的 历史 行为 及 相关 资源 的 信息 将 用 户 
兴趣 偏好 以 决策 直接 影响 因素 - 兴趣 度 的 形式 进行 显 
性 化 ,并 进行 语义 描述 。 实 现 上 可 以 分 为 数据 预 处 理 、 
兴趣 度 计算 ,决策 函数 生成 .兴趣 模型 语义 描述 4 个 环 
节 。 


(1) 数 据 预 处 理 。 其 任务 是 以 用 户 历史 行为 、 资 
源 相 关 数 据 为 基础 ,结合 所 选 资源 特征 ,将 数据 处 理 为 


几 个 方面 :@D 需 要 区 分 直接 影响 因素 和 间接 影响 因素 。 
@ 需 要 实现 决策 因素 的 具体 化 ,至 少 需要 保障 全 部 间 
接 影响 因素 以 及 不 存在 间接 影响 因素 的 直接 因素 的 具 
体 做 。@ 在 因素 的 作用 机 制 分析 中 ,一 方面 需要 特别 
关 演 多 取 值 影响 因素 的 作用 机 制 ,以 电影 演员 因素 为 
全 需要 特别 关注 一 部 影片 有 多 个 用 户 喜欢 或 讨厌 的 
,其 作用 是 正 向 的 还 是 负 向 的 ,影响 程度 如 何 变 
优 慷 一 方面 还 需要 关注 因素 间 的 关联 关系 , 即 用 户 决 
和 时 的 效用 函数 形式 ,最 为 常见 的 是 线性 函数 ,但 也 可 
能 各 在 非 线性 函数 形式 ,如 型 函数 。@ 受 个 体 决 策 


的 影响 ,可 能 存在 多 种 决策 模式 , 即 不 同 用 户 决策 中 考 


四 


虐 鸭 因素 是 有 差异 的 ,各 因素 间 的 交互 关系 也 可 能 是 
CN 


乡 提 化 的 ,在 分 析 中 应 涵盖 常见 的 决策 模式 。 
,多 特征 选取 
>< 资 源 特征 是 兴趣 建 模 与 推荐 结果 生成 中 的 直接 处 
理 对 象 ,因此 为 实现 个 性 化 推荐 中 对 用 户 决策 机 理 的 
拟 售 ,需要 在 特征 选择 环节 就 将 用 户 决策 机 理 融 入 进 
来 6)D 特 征 选 择 应 采用 自 项 向 下 的 思路 , 即 从 影响 用 
户 决策 的 因素 出 发 ,寻找 能 够 反映 该 因素 的 特征 或 特 
征 组 合 ;@ 特 征 选择 中 应 坚持 独立 性 原则 , 即 尽量 避免 
因素 间 的 耦合 ,但 需要 依据 用 户 的 决策 机 理 判 断 因素 
间 是 否 耦 合 ,而 非 其 客观 上 是 否 存在 相关 关系 ,如 影 
的 导演 ,主要 演员 等 主创 作者 信息 与 其 国家 地 区 强 相 
关 , 但 用 户 决策 中 一 般 将 其 视 为 两 个 因素 ,因此 在 特征 
选择 中 需要 全 部 纳入 进来 ;@ 对 于 同一 个 直接 影响 因 
素 , 用 户 可 能 采用 不 同 的 间接 因素 (组 合 ) 进行 判断 ， 
同时 单个 特征 也 可 能 存在 缺失 值 问题 ,因此 在 进行 特 
征 选择 时 可 以 保持 适当 的 宛 余 。 

此 外 ,为 保障 特征 选择 的 合理 性 ,还 需 遵循 以 下 几 
个 原则 :有 用 性 , 即 所 选 特征 至 少 与 一 个 影响 因素 有 
关联 ;@) 可 获得 性 , 即 所 选 特征 对 应 的 数据 是 能 够 获取 
的 ,否则 该 特征 无 法 发 挥 作用 ;@ 易 用 性 ,资源 特征 需 
以 量化 的 形式 进行 利用 ,为 降低 实现 难度 ,需要 选择 易 


完整 的 ,规范 的 、 便 于 深度 加 工 的 形式 。 在 该 环节 中 ， 
需要 进行 的 操作 包括 多 源 数据 整合 ,无效 数据 剔除 、 数 
据 完整 性 校 验 、 数 据 规范 化 .连续 数据 离散 化 等 ” 。 
此 外 , 建 模 所 需 的 部 分 特征 可 能 无 法 直接 获取 ,因此 在 
数据 预 处 理 中 可 能 还 需要 应 用 数据 抽取 统计 分 析 、 分 
类 聚 类 等 数据 挖掘 方 法。 

(2) 兴趣 度 计算 。 为 便于 后 续 利 用 ,兴趣 度 计算 
中 需要 改变 以 特征 为 粒度 的 计算 方法 ,以 用 户 决策 机 
理 分 析出 来 的 直接 影响 因素 作为 基本 单位 。 因 此 ,在 
计算 方法 上 ,对 于 包含 多 个 间接 影响 因素 或 由 多 个 特 
征 方 可 判断 的 直接 影响 因素 ,除了 常用 的 频次 分 析 、 加 
权 统 计 、 贝 叶 斯 分 类 ,决策 树 .神经 网 络 等 方法 外 ,还 需 
要 采用 知识 融合 的 方法 加 以 处 理 。 
(3) 用 户 决策 函数 生成 。 在 该 环节 中 ,首先 需要 
根据 用 户 决策 机 理 中 各 影响 因素 间 的 关系 确定 函数 的 
基本 形式 ,进而 采用 回归 分 析 法 利用 用 户 的 历史 行为 
数据 进行 决策 函数 的 拟 合 。 值 得 指出 的 是 :一 方面 ,为 
获得 最 佳 用 户 决 策 函 数 , 若 存 在 多 种 可 能 的 决策 模式 ， 
需要 对 多 种 用 户 决策 模式 逐一 进行 拟 合 与 比较 筛选 ; 
另 一 方面 ,用 户 决策 函数 确定 后 ,还 需要 视 情 况 对 用 户 
决策 机 理 中 的 影响 要 素 进 行 调整 ,剔除 无 关 要 素 , 从 而 
获得 个 性 化 决策 模型 。 

(4) 兴趣 模型 语义 表示 。 鉴 于 各 影响 因素 在 用 户 
决策 中 扮演 着 不 同 的 角色 ,因此 为 便于 推荐 结果 生成 
环 入 的 利用 ,需要 将 用 户 兴 趣 模型 进行 语义 表示 。 具 
体 而 言 ,以 用 户 个 性 化 决策 模型 中 的 所 有 直接 影响 因 
素 作 为 语义 表示 的 框架 ,从 而 将 用 户 兴趣 模型 表示 为 
一 个 高 维 向 量 空间 ,每 个 维度 对 应 一 个 用 户 决策 的 直 
接 影 响 因素 ,而 每 一 个 决策 直接 影响 因素 可 以 表示 为 
由 二 元 组 (因素 取 值 ,兴趣 度 ) 组 成 的 向 量 。 

2.4 推荐 结果 生成 

推荐 结果 生成 的 核心 是 基于 用 户 决 策 机 理 ,计算 

资源 与 用 户 兴 趣 模型 的 匹配 度 ,并 在 此 基础 上 挑选 一 
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部 分 展示 给 用 户 ,以 避免 带 来 新 的 信息 过 载 。 其 实现 
包括 候选 推荐 对 象 的 语义 表示 、 基 于 用 户 决策 函数 入 
推荐 度 计算 ,基于 推荐 度 的 结果 筛选 。 

(1) 候选 推荐 对 象 的 语义 表示 。 与 用 户 兴趣 模型 
的 语义 表示 相似 ,候选 推荐 对 象 的 语义 描述 也 需要 以 
用 户 决策 中 的 直接 影响 因素 作为 框架 要 素 。 如 果 要 素 
存在 直接 对 应 的 资源 特征 , 则 根据 其 取 值 生成 该 要 素 
的 取 值 ;如 果 不 存在 直接 对 应 的 资源 特征 , 则 需要 根据 
原始 资源 特征 与 要 素 间 的 映射 关系 对 其 加 以 处 理 。 

(2) 基 于 用 户 决策 函数 的 推荐 度 计算 。 在 该 环节 
中 ,首先 需要 利用 向 量 空间 模型 分 别 计算 资源 与 用 户 
兴趣 模型 中 各 要 素 的 相似 度 ,在 此 基础 上 ,根据 用 户 决 
策 函 数 进行 各 要 素 权 值 的 融合 ,生成 最 终 的 推荐 度 。 
本 (3) 基 于 推荐 度 的 结果 第 选 。 在 计算 各 候选 推荐 
对 奢 推 荐 度 的 基础 上 ,可 以 根据 具体 应 用 需求 筛选 一 
训 席 作为 最 终 推 荐 结果 。 较 为 常见 的 筛选 方法 是 Top 
,其 中 ,Top N 法 是 指 将 各 资源 按照 综合 
权 生 进行 排序 , 取 排 名 最 靠 前 的 N 个 或 N% 个 ; 阔 值 法 
是 措 设 置 一 个 综合 权 值 阔 值 ,将 大 于 该 阔 值 的 资源 都 
展 二 给 用 户 。 


人 


nu 


| 


GAN 为 验证 模型 的 有 效 性 ,选择 电影 为 对 象 进行 实验 ， 
并 硫 国 内 知名 的 电影 网 站 豆 准 电 影 (https://movie. 
deiifan. com/) 作为 数据 源 。 同 时 ,为 便于 评价 模型 效 
果 。 选 择 常用 的 向 量 空间 模型 作为 对 照 实验 中 的 推荐 
模型 。 
3: 人 样本 数据 

样本 数据 采用 的 是 笔者 于 2014 年 11 月 20 日 - 
12 月 15 日 期 间 采 集 的 一 份 包含 830 682 位 豆瓣 用 户 
观 影 记录 的 数据 集 。 采 集 内 容 包 括 ; 这 些 用 户 的 全 音 
观 影 记录 ,字段 包括 用 户 ID .影片 URL、 观 影 时 间 、 添 
加 的 标签 ;样本 中 所 涉及 的 101 486 部 影视 作品 的 基本 
信息 ,包括 URL、 片 名 .导演 ,演员 .编剧 类 型 . 制 片 国 
家 、 上 映 时 间 , 评 分 . 观 影 人 数 、 集 数 . 片 长 等 。 

在 获得 基础 数据 后 ,首先 剔除 电视 剧 .综艺 节目 等 
非 电影 类 数据 缺乏 上 映 时 间 字 段 的 数据 ,以 及 对 应 的 
用 户 观看 记录 。 在 此 基础 上 ,进行 样本 集 构建 :首先 从 
2014 年 5 月 3 日 -14 日 期 间 观看 至 少 1 部 影片 的 用 
户 中 ,随机 抽取 5 000 位 作为 初始 样本 ;其 次 ,为 避免 
数据 过 于 稀 朴 ,剔除 了 2014 年 5 月 3 日 以 前 观 影 少 于 
20 部 的 用 户 ,剩余 4 748 位 用 户 。 进 而 ,将 这 些 用 户 在 
2014 年 5 月 3 日 以 前 的 观 影 记录 作为 兴趣 建 模 的 数据 
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集合 , 共 620 612 条 记录 ;2014 年 5 月 3 日 -14 日 的 观 影 
记录 作为 测试 模型 效果 的 数据 集合 , 共 27 482 条 记录 。 
3.2 ”基于 用 户 决 策 机 理 的 电影 推荐 实验 过 程 

根据 前 文 构建 的 推荐 模型 ,基于 用 户 决 策 机 理 的 
电影 推荐 实验 主要 包括 用 户 观 影 决策 机 理 分 析 、 特 征 
选取 、 兴 趣 建 模 和 推荐 结果 生成 几 个 环节 。 
3.2.1 用 户 观 影 决策 机 理 分 析 “ 豆 办 电影 的 用 户 以 
大 学 生年 轻 白 领 等 高 学 历 的 年 轻 人 为 主 ,而 且 用 户 的 
观 影 兴趣 较为 稳定 ,因此 为 分 析 用 户 的 电影 决策 机 理 ， 
选取 了 15 位 华中 师范 大 学 和 武汉 大 学 的 在 校 学 生 进 
行 了 访谈 。 总 体 而 言 , 用 户 观 影 决策 中 考虑 的 主要 因 
素 较为 一 致 ,包括 演员 .导演 .主题 /类 型 .国家 地 区 . 评 
分 流行 度 ,新颖 度 几 个 因素 。 其 中 ,演员 .导演 .主题 / 
类 型 .国家 地 区 没有 明显 的 作用 倾向 ,需要 根据 用 户 的 
个 人 偏好 而 定 ; 评 分 流行 度 和 新 颖 度 则 有 明显 的 作用 
倾向 ,用 户 更 喜欢 评分 较 高 、 较 为 流行 和 新 颖 的 影 
但 其 作用 大 小 则 受用 户 个 人 偏好 的 影响 。 需 要 说 明 的 
是 ,一 部 影片 的 主题 /类 型 演员、 导演 .国家 地 区 的 取 
值 可 能 都 不 止 一 个 ,在 决策 过 程 中 ,用 户 对 每 个 因素 的 
兴趣 度 往往 并 非 其 各 个 取 值 兴趣 度 的 简单 相 加 ,而 更 
可 能 取 各 特征 取 值 的 兴趣 度 最 大 值 。 针 对 不 同 的 影 
片 ,这 些 因 素 间 的 作用 机 制 有 所 区 别 ,常见 的 有 以 下 两 
种 :中 如 果 特 别 喜欢 影片 的 导演 或 主要 演员 ,而 且 评 
分 流行 度 ,新颖 度 在 可 接受 范围 内 , 则 会 选择 观看 ;@) 
如 果 主 要 演员 或 导演 不 熟悉 .不够 喜欢 , 则 会 综合 考虑 
主题 /类 型 .国家 地 区 评分、 流行 度 、 新 颖 度 5 个 因素 
进行 决策 ,在 实际 决策 中 ,往往 先 依据 主题 /类 型 进行 
初步 过 滤 。 
3.2.2 特征 选取 尽管 前 面 所 述 的 影响 用 户 决策 的 
因素 之 间 存 在 一 定 的 相关 性 ,如 导演 和 演员 与 影片 的 
主题 /类 型 .国家 地 区 流行 度 是 显著 相关 的 ,但 用 户 在 
决策 过 程 中 将 它们 视 为 不 同 的 因素 ,因此 在 进行 电影 
和 村 征 选 择 时 与 这 些 因 素 相 关 的 特征 都 被 考虑 进来 。 具 
体 而 言 ,选择 的 特征 包括 (特征 与 影响 因素 间 的 对 应 关 
系 见 表 1 ) :中 导演 和 演员 ,这 两 个 因素 发 挥 作 用 的 方 
式 及 对 用 户 的 影响 程度 相近 , 且 取 值 上 存在 一 定 的 重 
合 ,因此 将 其 归并 到 一 起 ,统称 "创作 者 ”;@ 主 题 / 类 
型 ,影片 的 主题 与 类 型 存在 一 定 的 交叉 ,因此 也 将 其 放 
到 一 起 ,如 动作 家庭. 警 菲 等 ;@ 制 片 国家 地 区 ,用 户 
决策 中 考虑 的 国家 地 区 是 综合 主要 演员 、 影 片 故 事 发 
生地 或 影片 主要 人 物 所 属 区 域 进行 判断 的 ,但 这 一 信 
息 难 以 获得 ,考虑 实际 情况 ,采用 影片 的 制 片 国家 地 区 
进行 代 蔡 ; 鳃 评分 ,不 同人 群 对 影片 的 评分 可 能 有 较 大 
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差异 ,本 研究 中 采用 豆 办 用 户 的 评分 ;(5) 观 影 人 数 ,其 
Pe em He OAT 是 否 被 广大 
用 户 观 看 ,这 一 信息 可 以 用 豆 办 电影 页 面 上 的 观 影 
数 反 映 ;@ 上 映 时 间 , 该 地 征 的 作用 是 用 于 判断 影片 在 
当前 或 某 个 特定 时 刻 的 新 闲 度 。 


表 1 建 模 选用 特征 与 用 户 决策 影响 因素 间 的 映 身 
所 选 特征 决策 影响 因素 
创作 者 演员 .导演 
主题 /类 型 主题 /类 型 
制 片 国家 地 区 国家 地 区 
豆 泊 评分 评分 
观 影 人 数 流行 度 
上 映 时 间 新 颖 度 


3.2.3 
要 圣 观 吕 


兴趣 建 模 ”为 建立 用 户 电影 兴趣 模型 ,首先 需 
记录 和 影片 基本 数据 进行 预 处 理 , 在 此 基 而 
和 


> Sa ee 作 主 要 包括 以 下 儿 个 
而 : QD 影片 的 创作 者 信息 提取 。 包 括 影 片 的 导演 和 
注 S 表 中 排名 前 4 的 演员 (从 历届 奥斯卡 金 像 奖 、 金 鸡 
奖 俏 北 燃 .台湾 湾 金 马 奖 和 香港 金 像 奖 来 看 ,最 佳 男女 
开关 儿子 孝 位 于 演员 表 的 前 前 3 位 ,同时 考虑 到 存在 少 
， 电影 ,因此 取 排 序 前 4 的 演员 ) ， 


re 影片 中 的 导演 和 演员 去 重 。@ 影 片 主 
题 类 ed 该 类 信 rt edie 


行星 取 ， 实现 上 采用 了 文献 2 的 方法 进行 相关 主题 / 
类 型 标签 的 识 另 别 , 并 且 剔 除了 相关 影片 少 于 50 部 的 冷 


表 2 预 处 理 后 的 影 


门 主题 /类 型 。@ 从 抓 取 的 “ 制 片 国家 地 区 ”字段 提取 
影片 的 国家 地 区 信息 。@ 新 颖 度 提取 与 离散 人 化。 新颖 
度 是 一 个 相对 概念 ,在 对 用 户 兴趣 度 计算 时 ,需要 根据 
其 观 影 时 间 与 上 映 时 间 之 差 来 衡量 其 新 疾 度 。 为 便于 
分 析 , 依 据 830 682 用 户 2013 年 观 影 数据 将 新 颖 度 离 
散 化 :首先 ,将 数据 以 半年 为 区 间 进 行 分 割 ,并 统计 用 
户 观 影 量 的 分 布 ;其 次 ,统计 结果 显示 ,上 映 半年 以 内 
的 影片 占用 户 观 影 量 的 30. 7% ,7 -12 个 月 的 占 
7.0% ,明显 高 于 其 他 区 间 , 据 此 ,将 上 映 半年 以 内 6 - 
12 个 月 作为 新 颖 度 的 两 个 区 间 ; 再 次 ,1 -3 年 .3 -5 
年 5 -10 年 这 几 个 大 的 时 间 区 间 内 ,各 半年 区 间 的 数 
据 分 布 较为 接近 ,如 5 -10 年 区 间 的 数据 均 分 布 在 
1.45% -1.81% 之 间 , 据 此 将 上 映 1-3 年 .3 -6 年 .6 
- 10 年 作为 新 颖 度 的 3 个 区 间 ; 最 后 ,上 映 超过 10 年 
的 影片 ,其 被 观看 的 比例 相对 较 低 , 为 简化 计算 ,不 再 
细 分 ,将 其 作为 一 个 区 间 。@@ 评 分 提取 与 特征 离散 化 。 
如 果 抓 取 的 评分 字段 非 空 , 则 以 其 取 值 作为 影片 评分 ， 
否则 采用 影片 平均 分 6.9 分 作为 其 评分 。 此 外 , 豆 办 有 
对 电影 的 评分 采用 10 分 制 ,为 简化 计算 ,将 其 分 为 5 
分 及 以 下 5.1-6 分 6.1-7 分 7.1-8 分 8 分 以 上 5 
个 区 间 。@@ 流 行 度 信息 离散 化 。 流 行 度 的 取 值 范围 是 

一 个 很 大 的 连续 区 间 ,为 便于 衡量 ,采用 如 下 方法 进行 
处 理 : 按 照 观 影 频次 从 高 到 低 对 影片 排序 ,并 将 累计 观 

影 频次 占 全 部 观 影 频次 40% 的 影片 作为 第 1 档 ;对 于 
利 余 的 昌 彤 片 ,按照 相同 方法 进行 处 理 , 最 终 将 其 分 为 
10 档 。 预 处 理 后 的 影片 信息 如 表 2 所 示 : 


Pp 


数据 ( 局 部 ) 


影片 名 创作 者 主题 /类 型 ”国家 地 区 新 颖 度 评分 流行 度 
大 鱼 月 万. 麦克 格雷 格 , 杰 西 卡 ， 兰 格 , 比 利克 和 鲁 德 普 , 带 姆 波 顿 ”剧情 ,奇幻 美国 10 年 以 8 分 以 上 ”流行 度 1 档 
11 时 崔 丹 尼 尔 , 李 代 延 , 郑 在 咏 , 金 炫 锡 科幻 韩国 半年 内 6.1-7 分 流行 度 6 档 
扫 毒 刘青云 ,古天乐 ,张家辉 ,袁泉 , 陈 木 胜 动作 ,犯罪 香港 半年 内 7.1-8 分 流行 度 1 档 
就 是 闹 着 玩 的 卢 卫 国 , 李 易 祥 , 王 彤 喜剧 中 国 1-3 年 6.1-7 分 流行 度 5 档 
毒 战 古天乐 ,孙红雷 ,杜琪峰 , 钟 汉 良 ,黄奕 犯罪 , 警 菲 香港 1 -3 锋 7.1-8 分 流行 度 1 档 
流感 张 赫 , 柳 海 真 , 秀 爱 , 金 成 穆 灾难 韩国 6-12 个 月 7.1-8 分 流行 度 3 档 
巴 菲 的 奇妙 命运 伊利 亚 娜 ， 狄 克 鲁 效 , 佩 丽 冉 卡 … 曹 帕 拉 , 兰 比尔 ' 卡 普尔 人 生 , 喜 剧 ， 印度 1-3 年 8 分 以 上 ”流行 度 4 档 

爱情 
赫 尔 克 里 的 丰功伟绩 ” 埃 莉 诺 . 汤姆 林 森 ,大 卫 ' 苏 切 特 , 安 迪 “' 威尔逊 , 鲁 珀 特 : 伊 ”悬疑 ,犯罪 英国 半年 内 8 分 以 上 ”流行 度 8 档 
文 斯 
(2 ) 兴趣 度 计 算 。 兴 趣 度 是 为 推荐 结果 生成 环节 基于 此 ,创作 者 .主题 /类 型 兴趣 度 的 内 涵 应 当 是 


计算 候选 对 象 与 兴趣 模型 匹配 度 服务 ,在 计算 策略 设 
计 中 需要 考虑 后 续 的 应 用 需求 。 在 电影 决策 中 ,用 户 
一 般 首先 根据 创作 者 或 主题 /类 型 进行 初步 决策 ,然后 
根据 国家 地 区 .评分 流行 度 、 新 颖 度 做 出 最 终 决 策 。 


一 部 包含 该 特征 值 的 影片 ， 用 户 愿意 观看 的 概率 ， 
此 ,这 两 个 特征 的 兴趣 度 取 值 范围 应 是 [0,1 |] ;剩余 

个 特征 的 兴趣 度 内 涵 应 当 是 ,给 sn 
的 影片 , 相 较 于 该 特征 的 其 他 取 值 ,用 户 在 多 大 程度 上 
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更 愿意 看 该 影片 ,因此 其 取 值 应 围绕 1 进行 波动 ,理论 
上 范围 为 [0, + % )。 以 此 出 发 ,可 以 采用 公式 (1) 计 
算 创 作者 主题 /类 型 兴趣 度 , 公 式 (2) 计 算 其 他 4 个 特 
征 的 兴趣 度 。 


Flu,, i,) 一 1 
F(t,) 
Flall)* (F(u.,t.)-!1 
其 中 ,W(u,t) 指 用 户 u 对 特征 值 6 的 兴趣 度 ;F 
(ui,t;) 指 用 户 观 看 过 的 包含 特征 值 t 的 影片 数量 ,为 
避免 随机 因素 的 影响 ,要 求 F(u;,t;) 宇 3;F(t) 指 包含 


Wu 公式 (1) 


, 三) = 


W(u,, t,) 一 


特征 值 t 的 影片 总 数 ;F(all ) 指 影片 总 数 ;F(u) 指 用 
户 ui 看 过 的 影片 总 数 。 

(3) 用 户 决策 函数 拟 合 。 依 据 用 户 决策 中 各 因素 
间 的 关联 关系 ,可 以 将 用 户 决策 模式 进一步 抽象 为 :由 
依据 影片 的 创作 者 或 主题 /类 型 和 国家 地 区 进行 初步 
决策 ,如 果 感 兴趣 , 则 进入 下 一 步 ;中 依据 影片 的 新 疾 
度 .评分 和 流行 度 进一步 决策 。 故 而 ,可 以 将 用 户 决策 
函数 的 形式 表示 为 公式 (3 ) 所 示 的 形式 (为 平滑 影响 ， 
对 国家 地 区 ,新 疾 度 \ 评 分 和 流行 度 的 影响 进行 了 对 数 
处 理 ) 。 


max( maxw (ui; ,cre;) ,maxw( uw; ,typ;) * (1 + maxlogw(u; ,cou;))) * (1 +logw(u; ,rat;)) * (1 +logw(u; ,popt;)) * (1 +logw(u; ,nov;)) 


Wu,m) = (flogw(u;,rat;) > -1,logw(u;,pop;) > -1,logw(u;,nov;,) > -1) 


本 


Ph,W(ui,m ) 表示 影片 m 与 用 户 u 的 兴趣 模 
和 的 匹配 度 ,w(u ,ere) Ww (ui, typj) wCuycou) Ww 
(Fat) .w(u,pop ) ww(u,nov ) 表示 用 户 u, 对 影 

的 创作 者 cre; 主题 /类 型 typ;、 国 家 地 区 coui ,评分 rat;、 
流 得 度 pop) .新 颖 度 novi 的 兴趣 度 。 


0 (iflogw(ui,rat,)< -1, or logw( upop;) < -1,o0r logw(u;,nov,) < -1) 


公式 (3) 
因素 较为 一 致 ,因此 ,每 个 用 户 的 语义 描述 框架 都 是 由 
1 创作 者 , 主题 /类 型 ,国家 地 区 ,新颖 度 , 评 分 ,流行 
度 16 个 要 素 组 成 的 高 维 向 量 ; 其 中 每 一 个 维度 都 由 一 
系列 的 特征 值 及 兴趣 度 二 元 组 ,以 创作 者 维度 为 例 ,其 
可 以 表示 为 [创作 者 : (刘德华 ,0. 34),( 李 冰冰 ， 
0513) em ] ,示例 如 表 3 所 示 : 


表 3 用 户 语义 兴趣 模型 (局 部 ) 


创作 者 主题 /类 型 国家 地 区 新 颖 度 评分 流行 度 
安 贝 . 瓦 莱 塔 ,0.40 黑色 幽默 ,0.039 香港 ,1. 172 半年 内 ,1.022 8 分 以 上 ,1.176 流行 度 1 档 ,1.830 
姜 孝 镇 ,0.33 警 菲 ,0.076 韩国 ,1.202 6-12 个 月 ,0.768 7.1-8 分 ,1.124 流行 度 2 档 ,1. 642 
王 川 ,0.25 人 性 ,0.028 香港 ,1.218 1 -3 年 ,0.819 7.1-8 分 ,1.021 流行 度 1 档 ,1.939 
S1259677 中 岛 哲 也 ,0.25 心理 ,0.017 泰国 ,1.572 半年 内 ,1.170 8 分 以 上 ,1.228 流行 度 2 档 ,1. 662 
r= 李 治 廷 ,0. 13 人 生 ,0.028 香港 ,1.152 6-12 个 月 ,0.748 7.1-8 分 ,1.176 流行 度 3 档 ,1.322 


SS 


(1297671 


3.274 推荐 结果 生成 ”在 推荐 结果 生成 环节 ,首先 对 
候选 推荐 影片 进行 了 语义 表示 ,在 创作 者 .主题 /类 型 、 
国家 地 区 3 个 特征 权重 上 ,采用 了 二 元 赋 权 的 方法 , 即 
如 果 包 含 了 某 个 特征 , 则 取 值 为 1, 否 则 为 0; 对 于 新 绒 
度 .评分 和 流行 度 3 个 特征 , 则 根据 其 实际 情况 映射 到 
对 应 区 间 ; 在 此 基础 上 ,将 其 表示 为 向 量 形式 。 其 次 ， 
按照 用 户 的 个 人 兴趣 模型 及 决策 函数 ,计算 了 每 部 候 
选 推荐 影片 的 推荐 度 。 最 后 ,将 候选 推荐 影片 按照 扒 
荐 度 进行 降序 排列 ,并 选取 权 值 最 高 的 N 个 作为 最 终 
的 推荐 结果 。 在 实验 中 ,N 分 别 取 5、10 .20 .50 .100 和 
200。 
3.3 ”基于 向 量 空间 模型 的 电影 推荐 实验 过 程 

在 研究 中 ,基于 向 量 空间 模型 的 电影 推荐 是 对 照 
实验 ,用 于 作为 基准 线 评判 前 一 个 实验 的 效果 。 在 实 
验 设计 上 ,综合 基于 内 容 的 电影 个 性 化 推荐 相关 研究 
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特征 ,并 在 推荐 结果 生成 中 利用 流行 度 对 结果 进行 调 
权 。 


在 兴趣 建 模 中 ,假设 w(ui,t ) 表 示 用 户 u 对 特征 
值 t 的 兴趣 度 ,F(u,t;) 表 示 特 征 值 t; 在 用 户 ui 看 过 
影片 中 出 现 的 频次 ,F(u;) 指 用 户 ui 看 过 的 影片 数量 ， 
则 可 以 采用 公式 (4) 计 算 每 一 个 特征 值 的 兴趣 度 。 


Pu, | 
wm ) = 公式 (4) 
流行 度 调 权 策略 设计 上 采用 了 与 前 一 个 实验 相似 


的 思路 ,按照 同样 的 区 间 划 分 方式 将 电影 流行 度 分 成 
10 个 区 间 , 并 假设 w 表示 流行 度 区 间 j 的 权重 ,F 
(all) 指 影片 总 数 ;F( pop-j) 指 流行 度 区 间 为 j 的 影 

累计 观 影 频次 占 总 观 影 频次 的 比例 ;N(pop-j) 指 流行 
度 区 间 为 j 的 影片 数量 , 则 流行 度 区 间 j 的 权重 可 以 通 
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林 侈 ， 桑 运 侈 ， 龙 存 钰 . 基于 用 户 决 策 机 理 的 个 性 化 推荐 [可 . 图 书 情报 工作 ,2019 ,63(2):99 - 106. 


过 公式 (5 ) 进行 计算 。 

在 确立 兴趣 度 计 算 公 式 和 流行 度 调 权 策 略 的 基础 
上 ,可 以 通过 用 户 兴趣 向 量 uwu((byw(ub)), (bw 
(ubb)) CiwCua))…)》 影片 特征 向 量 mi ( (二 ， 
1) ,((f ,1)…((fi,1)…) 及 对 应 的 流行 度 权 值 w,,,,， 
的 积 来 计算 影片 与 用 户 兴 趣 模型 的 最 终 匹 配 度 , 如 公 
式 (6) 所 示 。 

W(ui, m) = * Im) * Woop 

3.4 实验 结果 及 分 析 

在 推荐 实现 中 ,以 全 部 75 694 部 影片 作为 候选 
集 , 但 对 于 每 一 位 用 户 , 则 剔除 其 于 2014 年 5 月 3 日 
以 前 已 经 看 过 的 影片 。 为 便于 衡量 实验 效果 ,选取 较 


为 由 型 的 P@ N 作为 评价 指标 ” ,并 采用 卡 方 检验 进 


笃 涟 著 性 检验 ,结果 如 表 4 所 示 ; 
表 4 ”实验 结果 及 其 显著 性 检验 


趴 大 方法 P@5  P@10 P@20  P@50 


Ww; =1 +log 


公式 (6) 


P@100  P@200 


用 局 决策 机 理 0.539%6 ** 0. 5496 ** 0.47% “er 0.4196 ** 0.3496 ** 0.289% 


ES 
辣 量 空间 模型 0.18% 0.21% 0.24% 0.23% 0.23% 0.22% 
wy 


“表示 p <0.001 


表 1 可 以 看 出 ,基于 用 户 决策 机 理 的 个 性 化 推 
缠 模 型 效果 显著 好 于 向 量 空间 模 型 的 效果 (p < 
>001) ,而 且 从 直观 上 看 ,推荐 效果 提升 也 非常 显著 ， 
ME@ 10 和 P@ 20 为 例 ,基于 用 户 决策 机 理 的 推荐 模 
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E 倪 的 根本 原因 是 模型 所 采用 的 思路 更 好 地 拟 合 了 用 
户 决策 机 理 , 具 体 而 言 主要 包括 3 个 方面 :由 从 用 户 决 
策 机 理 出 发 进行 特征 选择 ,全 面 、 系 统 地 涵盖 了 用 户 决 
策 时 的 主要 考虑 因素 ;@ 针 对 每 个 特征 维度 的 特点 进 
行 了 权 值 计算 方法 设计 ,使 其 更 符合 客观 实际 ,例如 在 
计算 用 户 对 创作 者 兴趣 度 大 小 时 考虑 了 其 作品 数量 因 
素 ;@ 基 于 多 维度 融合 的 综合 权 值 计 算 策略 更 符合 
户 决策 中 各 个 维度 的 关联 关系 。 

此 外 ,原型 实验 虽然 验证 了 基于 用 户 决策 机 理 的 
个 性 化 推荐 这 一 思路 的 有 效 性 ,但 实验 设计 仍 存在 一 
些 有 待 于 优化 的 问题 :中 在 实践 中 ,用 户 的 决策 模式 更 
加 复杂 , 且 受 决策 风格 的 影响 ,不 同 用 户 间 存 在 显著 差 
异 , 这 些 问 题 在 实验 设计 中 考虑 不 够 细致 ; 巴 原 型 实验 
中 的 部 分 参数 依据 经 验 进行 设置 ,缺乏 更 细致 的 调 优 
环 记 。 


4 结论 


为 改善 基于 内 容 的 个 性 化 推荐 效果 ,应 立足 于 用 
户 决策 机 理 进行 特征 选择 .兴趣 建 模 和 推荐 结果 生成 ， 
以 此 出 发 ,笔者 构建 了 基于 用 户 决策 机 理 的 个 性 化 推 
荐 模型 ,并 以 电影 数据 为 例 对 模型 效果 进行 了 检验 。 
结果 显示 ,相对 于 向 量 空间 模型 ,该 策略 能 够 大 幅 提升 
个 性 化 推荐 的 效果 ,从 而 验证 了 基于 用 户 决 策 机 理 的 
个 性 化 推荐 这 一 思路 的 有 效 性 。 结 合 电影 推荐 原型 实 
验 ,为 推动 研究 的 深化 ,今后 拟 重点 关注 如 下 问题 :中 
用 户 实 际 决策 中 因素 之 间 的 关系 可 能 比较 复杂 , 比如 
同一 个 特征 既 存 在 正 向 作用 的 特征 值 也 存在 负 向 作用 
的 特征 值 , 多 个 特征 同时 存在 竞 合 关系 等 ,针对 这 些 问 
题 , 需 要 研究 如 何在 模型 构建 中 进行 决策 因素 复杂 关 
联 关系 的 分 析 与 应 用 ;@ 不 同 决策 风格 用 户 关注 的 影 
啊 因 素 及 利用 这 些 因素 的 方法 可 能 差异 显著 ,为 获得 
更 好 的 推荐 效果 ,就 需要 研究 如 何 进行 用 户 决 策 风 格 
的 自动 识别 及 推荐 模型 的 自 适应 调整 ;BB 扩展 应 用 领 
域 ,将 其 应 用 于 图 书 \ 学 术 论 文 等 学 术 信息 资源 的 推荐 
中 ,以 进一步 验证 模型 的 效果 。 
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Abstract. [ Purpose/significance | The purpose of this paper is to propose an optimization strategy of features choo- 


sing and weight computing for content -based personalized recommendation. [ Method/process | This paper proposes a 


personalized recommendation model based on user’ s decision -making mechanism, which takes user decision mechanism as 


background knowledge in features selection, user interest profile construction and semantic representation, and user deci- 


sion function construction. To test this model, this paper conducts an experiment taking 4 748 users as sample, vector 


space model as reference model, and P@ N as evaluation index. | Result/conclusion | The results show that, in the cases 


of N equals 5, 10, 20, 50, 100, 200, the personalized recommendation model based on user decision -making mechanism 


is significantly better than the vector space model, and the effectiveness of the model is verified. 
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